智能论文笔记

SAFARI: Versatile and Efficient Evaluations for Robustness of Interpretability

Wei Huang , Xingyu Zhao , Gaojie Jin , Xiaowei Huang

分类：机器学习 | 人工智能

2022-08-19

深度学习（DL）模型的解释性可以说是值得信赖的AI面前的障碍。尽管可以解释的AI（XAI）社区做出了巨大的努力，但解释缺乏鲁棒性 - 与众不同的输入扰动可能会导致不同的XAI结果。因此，考虑到XAI技术，评估DL可解释性的可靠性至关重要。为此，我们确定了最先进的挑战，即最先进的挑战：i）XAI技术是高度异质的； ii）误解通常是罕见的事件； iii）最坏情况和整体鲁棒性都是实践意义的。在本文中，我们提出了两种评估方法来解决它们 - i）它们具有基于遗传算法（GA）和子集模拟（SS）的黑盒性质； ii）GA使用定制健身函数来有效地解决受约束的优化，而SS则致力于估计稀有事件概率； iii）引入了两个不同的指标，涉及最坏的解释差异和\ textit {}一般情况下的概率概念。我们进行实验，以研究优于最先进的方法的准确性，敏感性和效率。最后，我们展示了我们的方法的两种应用，用于对强大的XAI方法进行排名，并选择培训方案以提高分类和解释鲁棒性。

translated by 谷歌翻译

Short-term Load Forecasting with Distributed Long Short-Term Memory

Yi Dong , Yang Chen , Xingyu Zhao , Xiaowei Huang

分类：机器学习

2022-08-01

通过使用智能电表，零售商可以收集有关消费者行为的大量数据。从收集的数据中，零售商可以获取家庭概况信息并实施需求响应。尽管零售商更喜欢在不同客户中获取尽可能准确的模型，但有两个主要挑战。首先，零售市场中的不同零售商不会共享消费者的电力消耗数据，因为这些数据被视为其资产，这导致了数据岛的问题。其次，由于不同的零售商可以为各种消费者服务，因此电力负载数据是高度异质的。为此，提出了基于共识算法和长期记忆（LSTM）的完全分布的短期负载预测框架，这可能保护客户的隐私并满足准确的负载预测要求。具体而言，利用完全分布式的学习框架进行分布式培训，并采用共识技术来符合机密隐私。案例研究表明，所提出的方法具有相当的性能，而对准确性的集中方法具有相当的性能，但是所提出的方法显示了训练速度和数据隐私的优势。

translated by 谷歌翻译

Disentangling Spatial-Temporal Functional Brain Networks via Twin-Transformers

Xiaowei Yu , Lu Zhang , Lin Zhao , Yanjun Lyu , Tianming Liu , Dajiang Zhu

分类：人工智能

2022-04-20

如何识别和表征功能性大脑网络（BN）是基础，以获取对大脑组织架构机制的系统级别的见解。当前的功能磁共振（fMRI）分析高度依赖于空间（例如静止状态网络）或时间（例如任务刺激）域中特定模式的先验知识。此外，大多数方法旨在找到群体的通用功能网络，很少研究个体特定的功能网络。在这项工作中，我们提出了一个新颖的双转化器框架，以自我监督的方式同时推断空间和时间空间中的共同和单个功能网络。第一个变压器将空间区域的信息作为输入获取并生成空间特征，而第二个变压器将与时间相关的信息作为输入和输出时间特征。通过相互作用（权重共享）和两个变压器之间的约束，将空间和时间特征进一步分为共同和单个。我们将TwinTransFormer应用于Human Connectome Project（HCP）Motor Task-FMRI数据集，并确定了多个通用大脑网络，包括与任务相关和静止状态网络（例如默认模式网络）。有趣的是，我们还成功地恢复了与任务刺激无关的一组个人特定网络，仅在个人级别存在。

translated by 谷歌翻译

Less is More: Surgical Phase Recognition from Timestamp Supervision

Xinpeng Ding , Xinjian Yan , Zixun Wang , Wei Zhao , Jian Zhuang , Xiaowei Xu , Xiaomeng Li

分类：计算机视觉

2022-02-16

Surgical phase recognition is a fundamental task in computer-assisted surgery systems. Most existing works are under the supervision of expensive and time-consuming full annotations, which require the surgeons to repeat watching videos to find the precise start and end time for a surgical phase. In this paper, we introduce timestamp supervision for surgical phase recognition to train the models with timestamp annotations, where the surgeons are asked to identify only a single timestamp within the temporal boundary of a phase. This annotation can significantly reduce the manual annotation cost compared to the full annotations. To make full use of such timestamp supervisions, we propose a novel method called uncertainty-aware temporal diffusion (UATD) to generate trustworthy pseudo labels for training. Our proposed UATD is motivated by the property of surgical videos, i.e., the phases are long events consisting of consecutive frames. To be specific, UATD diffuses the single labelled timestamp to its corresponding high confident ( i.e., low uncertainty) neighbour frames in an iterative way. Our study uncovers unique insights of surgical phase recognition with timestamp supervisions: 1) timestamp annotation can reduce 74% annotation time compared with the full annotation, and surgeons tend to annotate those timestamps near the middle of phases; 2) extensive experiments demonstrate that our method can achieve competitive results compared with full supervision methods, while reducing manual annotation cost; 3) less is more in surgical phase recognition, i.e., less but discriminative pseudo labels outperform full but containing ambiguous frames; 4) the proposed UATD can be used as a plug and play method to clean ambiguous labels near boundaries between phases, and improve the performance of the current surgical phase recognition methods.

translated by 谷歌翻译

Coverage Path Planning for Robotic Quality Inspection with Control on Measurement Uncertainty

Yinhua Liu , Wenzheng Zhao , Hongpeng Liu , Yinan Wang , Xiaowei Yue

分类：机器人

2022-01-12

安装在机器人上的光学扫描仪通常用于质量检查，例如验证片状结构的尺寸规格。覆盖路径规划（CPP）显着影响机器人质量检验的准确性和效率。传统的CPP战略专注于最小化机器人的观点次数或在完全覆盖检查的条件下。在自由形状表面检查中较少考虑收集扫描数据时的测量不确定度。为了解决这个问题，提出了一种具有最佳观点采样策略的新型CPP方法，以将键测量点（MPS）的测量不确定性纳入自由形状表面检查。首先，基于MP的公差规范计算可行的测量不确定性范围。考虑测量不确定度和MPS的可见性，生成初始可行性视点集。然后，构建检查成本函数以评估所选视点的视野（FOV）的选定视点的数量和平均测量不确定性。之后，提出了一种增强的快速探索随机树（RRT *）算法，用于使用检查成本函数和CPP优化的观点采样。已经进行了案例研究，包括模拟试验和检查实验，以评估所提出的方法的有效性。结果表明，与基准法相比，关键MPS的扫描精度显着提高。

translated by 谷歌翻译

Revisiting Open World Object Detection

Xiaowei Zhao , Xianglong Liu , Yifan Shen , Yuqing Ma , Yixuan Qiao , Duorui Wang

分类：计算机视觉

2022-01-03

打开世界对象检测（OWOD），模拟知识持续增长的真正动态世界，试图检测已知和未知的类别，并逐步学习所识别的未知组。我们发现，尽管以前的欧瓦德工作建设性地提出了OWOD定义，但实验设置与不合逻辑的基准，令人困惑的度量计算和不当方法是不合理的。在本文中，我们重新思考OWOD实验环境，并提出了五项基本基准原则，以指导OWOD基准建设。此外，我们设计了两个特定于OWOD问题的公平评估协议，从未知课程的角度填充了评估的空白。此外，我们介绍了一个新颖且有效的OWOD框架，其中包含辅助提案顾问（PAD）和特定于类驱逐分类器（CEC）。非参数垫可以帮助RPN识别无需监控的准确未知提案，而CEC通过特定于类的驱逐函数校准过自信的激活边界并滤除令人困惑的预测。在我们的公平基准上进行的综合实验表明，我们的方法在现有的和我们的新指标方面表明了其他最先进的对象检测方法。\脚注{我们的基准和代码可在https://github.com提供/重新驱动/重新驱动。

translated by 谷歌翻译

Vision Transformer Based Video Hashing Retrieval for Tracing the Source of Fake Videos

Pengfei Pei , Xianfeng Zhao , Jinchuan Li , Yun Cao , Xiaowei Yi

分类：计算机视觉

2021-12-15

传统的假视频检测方法输出篡改图像的可能性值或可疑掩码。但是，这种无法解释的结果不能用作令人信服的证据。因此，更好地追溯虚假视频来源。传统的散列方法用于检索语义 - 相似的图像，这不能区分图像的细微差别。具体地，与传统视频检索相比，源跟踪。从类似的源视频中找到真实的挑战是一项挑战。我们设计了一种新的损失哈希多粒损失，解决了人们的视频非常相似的问题：与不同角度相同的场景，与同一个人的类似场景。我们提出了基于视觉变压器的模型，名为视频跟踪和篡改本地化（VTL）。在第一阶段，我们通过Vithash（VTL-T）训练哈希中心。然后，将假视频输入到Vithash，该vithash输出散列码。哈希码用于从哈希中心检索源视频。在第二阶段，源视频和假视频被输入到生成器（VTL-L）。然后，掩盖可疑区域以提供辅助信息。此外，我们构建了两个数据集：DFTL和Davis2016-TL。对DFTL的实验明显展示了我们在类似视频的追踪中框架的优势。特别地，VTL还通过在Davis2016-TL上实现了与最先进的方法的相当性能。我们的源代码和数据集已在github上发布：\ url {https:/github.com/lajlksdf/vtl}。

translated by 谷歌翻译

Reliability Assessment and Safety Arguments for Machine Learning Components in Assuring Learning-Enabled Autonomous Systems

Xingyu Zhao , Wei Huang , Vibhav Bharti , Yi Dong , Victoria Cox , Alec Banks , Sen Wang , Sven Schewe , Xiaowei Huang

分类：人工智能 | 机器学习 | 机器人

2021-11-30

嵌入在自主系统中的机器学习（ML）组件的增加使用 - 所谓的启用学习的系统（LES） - 导致压力需要确保其功能安全性。至于传统的功能安全，在工业和学术界的新兴共识是为此目的使用保证案例。通常，保证案例支持可靠性的支持权，支持安全性，并且可以被视为组织争论和从安全分析和可靠性建模活动产生的证据的结构化方式。虽然这些保证活动传统上由基于协商一致的标准，但由于ML模型的特点和设计，在安全关键应用中，LES构成了新的挑战。在本文中，我们首先向LES提出了一种强调定量方面的总体保证框架，例如，打破系统级安全目标与可靠性指标中所述的组件级要求和支持索赔。然后，我们向ML分类器介绍一种新的模型 - 不可能可靠性评估模型（RAM），该分类器利用操作简档和鲁棒性验证证据。我们讨论了模型假设以及评估我们RAM揭示的ML可靠性的固有挑战，并提出了实用的解决方案。还基于RAM开发了较低ML组件级的概率安全争论。最后，为了评估和展示我们的方法，我们不仅对合成/基准数据集进行实验，还展示了我们对模拟中自动水下车辆的综合案例研究的方法。

translated by 谷歌翻译

IMFNet: Interpretable Multimodal Fusion for Point Cloud Registration

Xiaoshui Huang , Wentao Qu , Yifan Zuo , Yuming Fang , Xiaowei Zhao

分类：计算机视觉

2021-11-18

现有的最先进的点描述符仅依赖于结构信息，从而省略纹理信息。然而，纹理信息对于我们的人类来区分场景部分至关重要。此外，基于学习的点描述符是尚不清楚原始点如何贡献到最终描述符的黑框。在本文中，我们提出了一种新的多模式融合方法，通过考虑结构和纹理信息来生成点云注册描述符。具体地，设计一种新的关注融合模块，用于提取描述符提取的加权纹理信息。此外，我们提出了一个可解释的模块来解释有助于最终描述符的原始点。我们使用描述符元素作为对目标层的丢失丢失，并将梯度视为对最终描述符的这一点的重要性。本文进一步移动了一步，以解释注册任务中的深度学习。 3DMATCH，3DLomatch和Kitti的综合实验表明，多模式融合描述符实现最先进的准确性并提高描述符的独特性。我们还表明我们的可解释模块在解释注册描述符提取时。

translated by 谷歌翻译

BI-GCN: Boundary-Aware Input-Dependent Graph Convolution Network for Biomedical Image Segmentation

Yanda Meng , Hongrun Zhang , Dongxu Gao , Yitian Zhao , Xiaoyun Yang , Xuesheng Qian , Xiaowei Huang , Yalin Zheng

分类：计算机视觉 | 人工智能

2021-10-27

分割是图像处理的基本操作。卷积操作遭受有限的接收领域，而全球建模是对分段任务的基础。在本文中，我们将图形卷积应用于分割任务，并提出改进的\ Texit {Laplacian}。与现有方法不同，我们的\ Textit {Laplacian}是数据相关的，我们介绍了两个注意力对角线矩阵来学习更好的顶点关系。另外，在执行基于图形的信息传播时，它利用了区域和边界信息。具体地，我们通过学习图表表示的关于不同类的边界意识区域 - 明智相关的模型和原因，其能够操纵沿着物体边界的空间增强的各个区域的长距离语义推理。我们的模型非常适合获得全局语义区域信息，同时也可以同时容纳局部空间边界特征。两种挑战数据集的实验表明，我们的方法优于最先进的方法在结肠镜检查中的息肉中的息肉和光盘和光学杯中的光盘和光学杯在彩色眼底图像上的分割。

translated by 谷歌翻译